FILTER MODE ACTIVE

#глубокое обучение

Найдено записей: 14

#глубокое обучение18.11.2025

Focal Loss против BCE: как исправить несбалансированную бинарную классификацию

'Сравнение Focal Loss и BCE на примере датасета с дисбалансом 99:1 показывает, как Focal Loss улучшает обнаружение редкого класса и более информативные разделяющие границы.'

ЧИТАТЬ →

#глубокое обучение20.08.2025

PyTorch vs TensorFlow в 2025 году: какую рамку выбрать?

'Короткое сравнение PyTorch и TensorFlow в 2025 по удобству разработки, производительности и возможностям продакшн-деплоя, чтобы помочь с выбором фреймворка.'

ЧИТАТЬ →

#глубокое обучение07.08.2025

Google AI выпустила DeepPolisher: новый инструмент на базе глубокого обучения для точной коррекции ошибок в сборках геномов

Google AI и Институт геномики UC Santa Cruz выпустили DeepPolisher — инструмент глубокого обучения, значительно снижающий ошибки в сборках геномов и повышающий точность эталонных человеческих геномов.

ЧИТАТЬ →

#глубокое обучение07.08.2025

Сравнение MoE Архитектур: Qwen3 30B-A3B от Alibaba против GPT-OSS 20B от OpenAI

Техническое сравнение MoE моделей Qwen3 30B-A3B от Alibaba и GPT-OSS 20B от OpenAI с акцентом на архитектурные особенности и рекомендации по применению.

ЧИТАТЬ →

#глубокое обучение02.08.2025

MIT представил метод стабильного обучения трансформеров с помощью липшицевых ограничений и оптимизатора Muon

Исследователи MIT разработали метод стабильного обучения больших трансформеров через липшицевы ограничения и спектральную регуляцию весов с оптимизатором Muon, исключая необходимость нормализаций.

ЧИТАТЬ →

#глубокое обучение01.08.2025

Falcon-H1: прорывная гибридная модель, конкурирующая с гигантами на 70 миллиардов параметров

Falcon-H1 от TII — гибридная модель, объединяющая внимание и модели состояний, достигающая результатов, сопоставимых с ведущими LLM на 70 миллиардов параметров, с оптимизацией эффективности и масштабируемости.

ЧИТАТЬ →

#глубокое обучение27.07.2025

GenSeg: революция в сегментации медицинских изображений с помощью генеративного ИИ при ограниченных данных

GenSeg — инновационный генеративный ИИ-фреймворк, значительно повышающий качество сегментации медицинских изображений при нехватке размеченных данных за счет создания оптимизированных синтетических наборов.

ЧИТАТЬ →

#глубокое обучение07.07.2025

Радиальное внимание: снижение затрат на видео-диффузию в 4,4 раза без потери качества

Радиальное внимание представляет новый механизм разреженного внимания, который сокращает затраты на обучение в 4,4 раза и время инференса в 3,7 раза в видео-диффузионных моделях, позволяя создавать более длинные видео без потери качества.

ЧИТАТЬ →

#глубокое обучение26.06.2025

Google DeepMind представила AlphaGenome: прорывная модель глубокого обучения для предсказания влияния мутаций в ДНК

Google DeepMind представила AlphaGenome — новую модель глубокого обучения, которая с высокой точностью предсказывает регуляторное влияние мутаций в ДНК по множеству биологических параметров, превосходя существующие решения.

ЧИТАТЬ →

#глубокое обучение05.06.2025

Лучшие книги по искусственному интеллекту, которые стоит прочитать в 2025 году

Узнайте о лучших книгах по искусственному интеллекту для 2025 года, охватывающих основы, продвинутые техники, этические вопросы и перспективы развития ИИ.

ЧИТАТЬ →

#глубокое обучение27.05.2025

Революция в нейросетях: дифференцируемые MCMC-слои для комбинаторной оптимизации

Новая AI-технология представляет дифференцируемые MCMC-слои, позволяющие нейросетям эффективно обучаться с приближенными комбинаторными решателями и значительно улучшать результаты в сложных задачах оптимизации, например маршрутизации.

ЧИТАТЬ →

#глубокое обучение20.05.2025

Meta представляет KernelLLM: 8-миллиардная модель, преобразующая PyTorch модули в эффективные Triton GPU ядра

Meta выпустила KernelLLM — 8-миллиардную модель, которая автоматизирует преобразование PyTorch модулей в эффективные Triton GPU ядра, превосходя более крупные модели в бенчмарках.

ЧИТАТЬ →

#глубокое обучение25.04.2025

Забывающий Трансформер (FoX): Революция в Длинных Контекстах Языкового Моделирования с Эффективным Управлением Памятью

Исследователи из Mila и Университета Монреаля представили FoX — новую версию трансформера с обучаемыми forget gate, которая улучшает качество и эффективность моделирования длинных контекстов без потерь в скорости.

ЧИТАТЬ →

#глубокое обучение23.04.2025

Оптимизатор Muon от Microsoft значительно ускоряет гроккинг в трансформерах

Исследователи Microsoft показали, что оптимизатор Muon существенно ускоряет гроккинг в моделях трансформеров, обеспечивая более быстрый переход от запоминания к обобщению по сравнению с AdamW.

ЧИТАТЬ →